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Neurotrypsin 

Die vorliegende Erfindung betrifft Neurotrypsine und ein Medikament, 
welches diese Substanzen enthalt Oder auf diese Substanzen einwirkt 

5 

Neurotrypsin ist eine neu entdeckte Serinprotease, welche vor allem im 
Gehirn und in der Lunge exprimiert wird; die Expression im Gehirn findet fast 
ausschliesslich in Nervenzellen statt. 

!0 Neurotrypsin hat eine bisher nicht gefundene Domanenzusammensetzung: 

Neben der Protease-Domane findet man 3 oder 4 SRCR (Scavenger Receptor 
Cysteine-Rich)-Domanen und eine Kringle-Domane. Es ist hervorzuheben, dass die 
Kombination von Kringle- und SRCR-Domanen bisher noch nie in Proteinen gefunden 
wurde. Am Aminoterminus des Neurotrypsin-Proteins befindet sich ein Segment von 

15 uber 60 Aminosauren, welches einen ausserordentiich hohen Anteil von Prolin und 
basischen Aminosauren (Arginin und Histidin) aufweist. 

Die Erfindung ist durch die Merkmale in den unabhangigen Anspruchen 
gekennzeichnet. Bevorzugte Ausfuhrungsformen sind in den abhangigen Anspruchen 
20 definiert. 



Die neu gefundenen Neurotrypsine 

- Neurotrypsin des Menschen (Verbindung der Formel I), 

- Neurotrypsin der Maus (Verbindung der Formel II) 

unterscheiden sich strukturell sehr stark von den bisher bekannten Serinproteasen. 
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Die bezuglich der Protease-Domane strukturell am nachsten mit den neuen 
Verbindungen verwandte Serinprotease, namlich Plasmin (des Menschen), weist eine 
Aminosauresequenz-ldentitat von lediglich 44% auf. 



Das Prolin-reiche, basische Segment am Aminoterminus weist eine gewisse 
Aehnlichkeit auf zu basischen Segmenten der Netrine und der 
Semaphorine/Collapsine. Aufgrund dieses Segmentes ist es wahrscheinlich, dass 
Neurotrypsin mittels Heparin-Affinitatschromatographie angereichert werden kann. 

Die Neurotrypsine des Menschen (Verbindung der Formel I), und der Maus 
(Verbindung der Formel II) weisen unter sich eine sehr hohe strukturelle Ahnlichkeit 
auf. 

Die Identitat der Aminosauresequenzen der nativen Proteine der 
Verbindungen der Formeln I oder II betragt 81%. 

Das Neurotrypsin des Menschen (Verbindung der Formel I) weist eine 
codierende Sequenz von 2625 Nucleotiden auf. Das codierte Peptid der Verbindung 
der Formel I ist 875 Aminosauren lang und enthalt ein Signalpeptid von 20 Amino- 
sauren. Das Neurotrypsin der Maus (Verbindung der Formel II) weist eine codierende 
Sequenz von 2283 Nucleotiden auf. Das codierte Protein der Verbindung der 
Formel II ist 761 Aminosauren lang und enthalt ein Signalpeptid von 21 Aminosauren. 
Der Grund fur die grossere Lange des Neurotrypsins des Menschen liegt darin, dass 
dieses 4-SRCR-Domanen aufweist, wahrend das Neurotrypsin der Maus nur 
3 SRCR-Domanen hat. 

Die bei beiden Verbindungen (Verbindung der Formel I und Verbindung der 
Formel II) vorhandenen Domanen weisen einen hohen Grad von Sequenzahnlichkeit 
auf. Die einander entsprechenden SRCR-Domanen der Verbindungen der Formeln I 
und II weisen eine Aminosauresequenzidentitat von 81% bis 91% auf. Die 
entsprechenden Kringle-Domanen haben eine Aminosauresequenzidentitat von 75%. 
Ein hoher Grad von Aehnlichkeit besteht vor allem auch in der enzymatisch aktiven 
(d.h. proteolytischen) Domane (90% Aminosauresequenzidentitat). 
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Die Proteasedomanen der Neurotrypsine des Menschen (Verbindung der 
Formel I) und der Maus (Verbindung der Formel II) sind im Folgenden gegeneinander 
aufgereiht, urn den hohen Grad von Sequenzidentrtat zu illustrieren. 



CGLRLLHRRQKRI IGGKNSLRGGWPWQVSLRLKS SHGDGRLLCGATLLSS 5 0 

I I 1 1 1 M I I I I M I i I - 1 | | | | : | | | | . | | ! | : i - 1 I I I I t ! I I ! I ! I I I 

CGLRLLHRRQKRI IGGNNS LRGAWPWQAS LRLRS AHGDGRLLCG AT LLSS 



CWVLTAAHC F KRYGNSTRS YAVRVGDYHTLVPEEFEEEIGVQQ I VIHREY 10 0 

NMM I I I I II II--M Ml IIMM M M II Ihl II I I I I I I i hi 
CWVLTAAHC FKRYGNNSRSYAVRVGDYHTLVP EE FEQEIGVQQ I VI HRNY 



R PDRSDYD I A LVRLQGPEEQCARFS SHVL PAC L PLWRERPQKTASNCYIT 15 0 

M I I I I M I I I M I I I I : I I I I | : | . | | | | | | | | M I I I I I M I I I I - I I 

R P DRS DYD I A LVRLQGPGEQCARLSTHVL PAC L P LWRERPQKT A SNCH I T 



G WGDTGRA Y S RTLQQAAI P LLPKRFC EERYKGRFTGRMLC AGNLHEHKRV 2 00 

i I I I I I I I II I I I I I I I : I I | | | | | | . | | | | I II I I I I I I I I I : I | | 
G WGDTGRA YS RTLQQAAVP LL P KRFCKERYKGLFTGRMLCAGNLQEDNRV 



DSCQGDSGG P LMCERPGES WVVYGVTSWG YGCGVKDS PGVYTKVS AFVPW 2 5 0 

I I M M I I I I I I I I : I : I | | | | | M I I I I I I I I I I I - I I I I I : I ■ I | | | | 
D S CQGDSGG P LMC EKPDESWVVYGVTS WGYGCGVKDT PGVYTRV P AFVPW 



IKSVTKL 258 
I I II I ■ I 
I KSVTSL 
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Von den in den Vergleich einbezogenen 258 Aminosauresequenzpositionen sind 233 
in beiden Verbindungen (Verbindung der Formel I und Verbindung der Formel II) mit 
der gleichen Aminosaure besetzt (markiert mit senkrechten Strichen). 



Verglichen mit den bekannten Serinproteasen ist fur die 
erfindungsgemassen Neurotrypsine einzigartig, dass sie gemass bisherigen 
Erkenntnissen in ausgepragtem Masse von Nervenzellen exprimiert werden. Ein 
anderes Organ mit starker Expression von Neurotrypsin ist die Lunge (siehe 
Gschwend et al., Mol. Cell. Neurosci., in press, 1997). 

Die den Strukturen der Verbindungen der Formeln I oder II am starksten 
gleichenden Proteine sind Serin-Proteasen, wie Gewebe-Plasminogenaktivator (tPA), 
Urokinase-Plasminogenaktivator (uPA), Plasmin, Trypsin, Apolipoprotein (a), 
Coagulation-Factor XI, Neuropsin, und Acrosin. 



Im erwachsenen Gehirn werden die erfindungsgemassen Verbindungen 
vorwiegend in der Grosshirnrinde, dem Hippocampus und der Amygdala exprimiert. 

Im erwachsenen Hirnstamm und Ruckenmark werden die 
erfindungsgemassen Verbindungen vorwiegend in den motorischen Nervenzellen 
exprimiert. Eine etwas schwachere Expression ist in den Nervenzellen der 
oberflachlichen Schichten des Hinterhorns des Ruckenmarks zu finden. 

Im erwachsenen peripheren Nervensystem werden die erfindungsgemassen 
Verbindungen in einer Subpopulation der Spinalganglienneurone exprimiert. 

Das Gen-Expressionsmuster der erfindungsgemassen Verbindungen im 
Gehirn ist ausserst interessant, weil diese Molekule im adulten Nervensystem vor 
allem in Nervenzellen derjenigen Regionen exprimiert werden, denen eine wichtige 
Rolle bei Lern- und Gedachtnisfunktionen zugeschrieben wird. 

Das Gen-Expressionsmuster der erfindungsgemassen Verbindungen in der 
Grosshirnrinde (vor allem Schicht V und VI) ist ausserst interessant, weil eine 
Reduktion der zellularen Differenzierung in der Grosshirnrinde in Assoziation mit 
Schizophrenie gefunden wurde. 



Eine andere hervorzuhebende Eigenschaft der erfindungsgemassen 
Verbindungen besteht darin, dass sie von den Nervenzellen sezerniert werden. 

Diese Tatsache - zusammen mit der Funktion als Protease und dem 
Expressionsmuster im sich entwickelnden und adulten Gehirn - lassen eine Rolle der 
erfindungsgemassen Verbindungen bei der Regulation der extrazellularen Proteolyse 
in Gehirnarealen vermuten, welche an der Verarbeitung und Speicherung von 
eriernten Verhaltensweisen, erlernten Gefuhlen oder von Gedachtnisinhalten beteiligt 
sind. 

Zusammen mit kurzlich gefundener Evidenz ftir eine Rolle von 
extrazellularen Proteasen bei der neuralen Plastizitat, lasst das Expressionsmuster 
vermuten, dass die proteolytische Wirkung von Neurotrypsin eine Rolle innehat bei 
strukturellen Reorganisationen im Rahmen von Lern- und Gedachtnis-Operationen, 
zum Beispiel Operationen, welche der Verarbeitung und Speicherung von erlernten 
Verhaltensweisen, erlernten Gefuhlen oder von Gedachtnisinhalten beteiligt sind. 

Das Gen-Expressionsmuster der erfindungsgemassen Verbindungen im 
Ruckenmark und in den Spinalganglien ist interessant, weil diese Molekule im adulten 
Nervensystem in Nervenzellen derjenigen Zellgruppierungen exprimiert werden, 
denen eine Rolle bei der Verarbeitung von Schmerz, sowie bei der Entstehung 
pathologischer Schmerzzustande zugeschrieben wird. 

Die erfindungsgemassen Verbindungen wurden im Rahmen einer Studie 
gefunden, welche zum Ziel hatte, Trypsin-ahnliche Serinproteasen im Nervensystem 
aufzuspuren. 

Als erste wurde die Verbindung der Formel II entdeckt und charakterisiert 
(siehe Gschwend et al., Mol. Cell. Neurosci., in press, 1997). 

Durch ein "Alignment" der Proteasedomanen von 7 bekannten Serin- 
proteasen (tissue-type Plasminogenaktivator, urokinase-type Plasminogenaktivator, 
Thrombin, Plasmin, Trypsin, Chymotrypsin und pankreatische Elastase) in den 



Regionen des Histidins und des Serins der katalytischen Triade der aktiven Stelle 
wurden die Sequenzen von sogenannten "Primer-Oligonucleotiden" fur die 
Polymerasen-Kettenreaktion ermittelt. 



Die Primer-Oligonucleotide wurden in einer Polymerasen-Kettenreaktion 
(PCR) zusammen mit ss-cDNA aus Total-RNA aus Gehirnen von 10 Tage alten 
Mausen eingesetzt und fuhrten zur Amplifizierung eines cDNA-Fragments mit einer 
Lange von ungefahr 500 Basenpaaren. 

Dieses cDNA-Fragment wurde erfolgreich zur isolierung von weiteren cDNA- 
Fragmenten aus im Handel erhaltlichen cDNA-Bibliotheken eingesetzt. Zusammen 
erstreckten sich die isolierten cDNA-Fragmente uber die voile Lange des codierten 
Teils der Verbindung der Formel II. 

Durch herkommliche DNA-Sequenzierung wurde die vollstandige 
Nucleotidsequenz und die davon abgeleitete Aminosauresequenz der Verbindung der 
Formel II erhalten. 



Die Verbindung der Formeln I wurde aufgrund ihrer ausgepragten Ahnlichkeit 
mit der Verbindung der Formel II mittels herkommlicher PCR kloniert. 

Die eingesetzten Primer-Oligonucleotide wurden gemass der bekannten 
Sequenz der Verbindung der Formel II synthetisiert. 

Die Klonierung der Verbindung der Formel I wurde mittels zwei im Handel 
erhaltlichen cDNA-Bibliotheken aus fotalem menschlichen Gehirn durchgefuhrt. 

Diese Art der Klonierung kann auch zur Isolierung der homologen 
Verbindung anderer Spezies, wie Ratte, Kaninchen, Meerschweinchen, Rind, Schaf, 
Schwein, Primaten, Vogel, Zebrafisch (Brachydanio rerio), Drosophila melanogaster, 
Caenorhabditis elegans etc. verwendet werden. 



Die codierenden Nucleotidsequenzen konnen eingesetzt werden zur 
Erzeugung von Proteinen mit den codierten Aminosauresequenzen der Verbindungen 
der Formeln I oder II. Ein in unserem Labor praktiziertes Verfahren erlaubt die 
Produktion von recombinanten Proteinen in Myelomazellen als Fusionsprotein mit 
einer Immunoglobulin-Domane (konstante Domane der Leichten-Kette-Kappa). Das 
Konstruktionsprinzip ist im Detail beschrieben durch Rader et al. (Rader et al. f Eur. J. 
Biochem. 21I> ( Seiten 133-141, 1993). Das so von den Myelomazellen synthetisierte 
Fusionsprotein wurde durch Immunoaffinitatschromatographie mittels eines 
monoklonalen Antikorpers gegen die Ig-Domane der Leichten-Kette-Kappa isoliert 
Mit der gleichen Expressionsmethode kann auch das native Protein einer Verbindung, 
ausgehend von der codierenden Sequenz, produziert werden. 

Die codierenden Sequenzen der Verbindungen der Formeln I oder II konnen 
als Ausgangsverbindungen dienen fur das Aufspuren und die Isolierung von Allelen 
der Verbindungen der Formeln I oder II. Sowohl die Polymerasen-Kettenreaktion, als 
auch die Nucleinsaure-Hybridisierung konnen zu diesem Zweck eingesetzt werden. 

Die codierenden Sequenzen der Verbindungen der Formeln I oder II konnen 
als Ausgangsverbindungen dienen fur sogenannte "site-directed mutagenesis", urn 
Nucleotidsequenzen zu generieren, welche die durch die Verbindungen der Formeln I 
oder II codierten Proteine, oder Teile davon, codieren, aber als Resultat 
unterschiedlicher Verwendung alternativer Codons, degeneriert sind bezuglich der als 
Verbindungen der Formel I oder II definierten Nucleotidsequenzen. 

Die codierenden Sequenzen der Verbindungen der Formeln I oder II konnen 
als Ausgangsverbindungen dienen fur die Herstellung von Sequenzvarianten durch 
sogenannte "site-directed mutagenesis". 

Die nachfolgenden Beispiele illustrieren die vorliegende Erfindung. 



Beispiel 1 : 



CDNA.Klpnien.nq der Verhindnrm dpr For™. f , ^eurotryp ^in ripr u m) 



10 



15 



Totale RNA wurde aus dem Gehirn von 10 Tage alten Mausen (ICR-ZUR) 
gemass der Methode von Chomczynski und Sacchi (1987) isoliert. Herstellung von 
einzelstrangiger cDNA erfolgte unter Benutzung von Oligo(dT)-"Primer" und einer 
RNA-abhangigen DNA-Polymerase (Superscript RNase H-Reverse Transcriptase; 
Gibco-BRL, Gaithersburg, MD) gemass den instruktionen des Herstellers. Fur die 
Durchfiihrung der Polymerasen-Kettenreaktion wurden ein -Primer" in Leserichtung 
gemass einem Aminosauresequenzabschnitt aus der Region des konservierten 
Histidins der katalytischen Triade und ein -Primer" in entgegengesetzter Richtung 
gemass einem Aminosauresequenzabschnitt aus der Region des konservierten 
Serins der katalytischen Triade der Serinproteasen synthetisiert. Die fur die 
Bestimmung der Oligonucleotid-Primer eingesetzten Aminosauresequenzen . und 
deren Ermittlung durch den Vergleich der Sequenzen von 7 bekannten 
Serinproteasen ist im folgenden dargestellt. 



Protease 
domain 

tPA <m> 
uPA <m) 
thrombin (m) 
plasmin (m) 
trypsin (m) 
chymTryp b (r) 
pancElas II (m) 



JET 



-SSC 
.SPC 
. SDR 
-APE 
. NDQ 
. SED 
. ANN 



WVLSAAHC 
WVASAAHC 
WVLTAAHC 
WVLTAAHC 
WVVSAAHC 
WVVTAAHC 
WVLTAAHC 



FLE. 
FIQ. 
ILY. 
LKS . 
YKY . 
GVK. 
LSN . 



Primer 



(X) 5'-TGG GTI SYI WSI GCI GCI CAT TG-3 ■ 



J- c 



. HDA 
.TVS 
.GDA 
. VDS 

-KDS 
.VSS 
.TSS 



C Q G D S 

C K G D S 

C E G D S 

C Q G D S 

C Q G D S 



CM 
C N 



G D S 
G D S 



G G 

G G 

G G 

G G 

G G 

G G 

G G 



PLV. . 

PLI. . 

PFV. . 

PLV. . 

PW. . 

PLV. . 

PLN. . 



(II) 3 ' -ACR BTY CCI CTR WSI CCI CC-5' 
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Die Proteasen-Dornanen von 7 bekannten Serinproteasen (tissue-type- 
Plasminogenaktivator, Urokinase-type Plasminogenaktivator, Thrombin, Plasmin, 
Trypsin, Chymotrypsin und pankreatische Elastase) wurden im Bereich des 
konservierten Histidins und Serins der katalytischen Triade der aktiven Stelle 
gegeneinander aufgereiht. Die in diesen Regionen konservierten Aminosauren 
wurden als Ausgangssequenz fur die Bestimmung von degenerierten Primern 
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benutzt. Die Primersequenzen sind nach der Empfehlung der lUB-Nomenklatur 
(Nomenclature Committee, 1985) angegeben. 

Die in der PCR eingesetzten Primer trugen zur Erleichterung einer spateren 
Klonierung zusatzlich die Restriktionsstellen EcoRI und BamHl am 5'-Ende. 

5 

Folgende Primer wurden eingesetzt: 

In Leserichtung (sense primers): 

5 , -GGGGAATTCTGGGTI(C/G)(T/C)l(T/A)(G/C)IGCIGCICA(T/C)TG-3 , 
10 In Gegenrichtung (antisense primers): 

5 , -GGGGGATCCCCICCI(G/C)(A^^)(A/G)TCICC(C/^)T(G/CyT)(G/A)CA-3^ 

Die Polymerasen-Kettenreaktion wurde unter Standard-Bedingungen mittels 
der DNA-Polymerase AmpliTaq (Perkin Elmer) gemass den Empfehlungen des 
15 Produzenten durchgefuhrt. Das folgende PCR-Profil wurde eingesetzt: 93°C fur 3 
Minuten, gefolgt von 35 Zyklen von 93°C fur 1 Minute, 48°C fur 2 Minuten und 72°C 
fur 2 Minuten. Im Anschluss an den letzten Zyklus wurde die Inkubation bei 72°C 
wahrend weiteren 10 Minuten fortgesetzt. 

20 Die amplifizierten Fragmente hatten eine Lange von ungefahr 500 

Basenpaaren. Sie wurden mit EcoRI und SamHI geschnitten und in einen Bluescript- 
Vektor eingefugt (Bluescript SK(-), Stratagene). Die resultierenden Klone wurden 
durch DNA-Sequenzbestimmung mitteis der Dideoxy-Kettenterminations-Methode 
(Sanger et al M Proc. Natl. Acad. Sci. USA 71, 2163-2167, 1977) auf einem 

25 automatisierten DNA-Sequenziergerat (LI-COR, Modell 4000L; Lincoln, NE) unter 
Benutzung eines kommerziellen Sequenzierkits (SequiTherm long-read cycle 
sequencing kit-LC; Epicentre Technologies, Madison, Wi) analysiert. Die Analyse 
fuhrte zu einer 474 Basenpaare umfassenden Sequenz aus dem katalytischen 
Bereich der Serinproteasedomane der Verbindung der Formel II. 
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Das 474 Basenpaar lange PCR-Fragment wurde zum Absuchen einer 
Oligo(dTKprimed" Uni-ZAP-XR-cDNA-Bibliothek aus Gehirn von 20 Tage alten 
Mausen (Stratagene; Cat. No. 937 319) eingesetzt. Es wurden 3x1 0 6 Lambda- 
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Plaques mittels des radioaktiv markierten PCR-Fragments unter hochstringenten 
Bedingungen (Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring 
Harbor Laboratory Press, 1989) abgesucht und 24 positive Klone gefunden und 
isoliert. 



Aus den positiven Lambda-Uni-ZAP-XR-Phagemid-Klonen wurde das 
entsprechende Bluescript-Plasmid nach der Standardmethode gemass den 
Empfehlungen des Herstellers (Stratagene) durch in wVo-Exzision herausgeschnitten. 
Um die Lange der eingefiigten Fragmente zu bestimmen, wurden die entsprechenden 
Bluescript-Plasmid-Klone mit Sad und Kpn\ verdaut. Die Klone, welche die langsten 
Fragmente enthielten, wurden mittels DNA-Sequenzierung (wie oben beschrieben) 
und anschliessender Auswertung mittels der GCG-Software (Version 8.1, Unix; 
Silicon Graphics, Inc.) analysiert. 

Da keiner der Klone die codierende Sequenz in voller Lange enthielt, wurde 
eine zweite cDNA-Bibliothek abgesucht. Die hierfur eingesetzte Bibliothek war eine 
Oligo(dT)- und -Random-Primed" cDNA Bibliothek in Lambda-Phagen (Lambda gt10), 
welche auf mRNA aus 15 Tage alten Maus-Embryonen basierte (oligo(dT)- and 
random-primed Lambda gt10 cDNA library; Clontech, Palo Alto, CA; Kat. No. ML 
3002a). Als Sonde wurde ein radioaktiv markiertes DNA-Fragment (Aval/Aatll) vom 
5--Ende des langsten Klones der ersten Suche eingesetzt, und es wurden ungefahr 
2x10 6 Plaques abgesucht. Dabei wurden 14 positive Klone gefunden. Die cDNA- 
Fragmente wurden mittels EcoRI herausgeschnitten und in den Bluescript-Vektor 
(KS( + ); Stratagene) kloniert. Die Sequenzanalyse erfolgte wie oben beschrieben. 

Man erhielt so die Nucleotidsequenz iiber die voile Lange der cDNA von 
2361 resp. 2376 Basenpaaren der Verbindung der Formel II. Mit dem beschriebenen 
Verfahren der PCR-Klonierung konnen auch Varianten-Formen der Verbindungen der 
Formein I und II gefunden und isoliert werden, beispielsweise deren Allele, oder 
deren Splice- Varianten. Das beschriebene Verfahren des Absuchens einer cDNA- 
Bibliothek ermoglicht auch das Auffinden und die Isolierung von Verbindungen, 
welche unter stringenten Verbindungen an die codierenden Sequenzen der Formein I 
und II hybridisieren. 



Beispiel 2: 



Klonierunq der cDNA der V erbindung der Formel I (Ncurotrvpsin des 
Menschen) 

Die Klonierung der cDNA der Verbindung der Formel I wurde auf der 
Grundlage der Nucleotid-Sequenz der Verbindung der Formel II durchgefuhrt. Als 
erster Schritt wurde ein Fragment der Verbindung der Formel I mittels 
Polymerasenkettenreaktion (PCR) amplifiziert. Als Matrize diente die DNA aus einer 
cDNA-Bibliothek vom Gehirn eines menschlichen Foetus (17.-18. 
Schwangerschaftswoche), welche auf dem Markt (Oligo(dT)- and random-primed, 
human fetal brain cDNA library in the Lambda ZAP II vector, Cat. No. 936206, 
Stratagene) erhaltlich ist. Die synthetischen PCR-Primer enthielten, zur Erleichterung 
der nachfolgenden Klonierung, die Restriktionsstellen Hind III und Xho I am 5'-Ende. 

In Leserichtung (sense primers): 

5'-GGGAAGCTTGGICA(A/G)TGGGGIACI(A/G)TITG(C/T)GA(C/T)-3' 

In Gegenrichtung (antisense primer): 

5'-GGGCTCGAGCCCCAICCTGTTATGTAAIAGTTG-3' 



Die PCR wurde unter Standard-Bedingungen mittels der DNA-Polymerase 
Amplitaq (Perkin Elmer) gemass den Empfehlungen des Produzenten durchgefuhrt. 
Das entstandene Fragment von 1116 Basenpaaren wurde in einen Bluescript-Vektor 
eingefugt (Bluescript SK(-), Stratagene). Ein 600 Basenpaare langes Hind Ill/Stu I- 
Fragment, entsprechend der 5'-Halfte des 1116 Basenpaare langen PCR-Fragments, 
wurde zum Absuchen einer Lambda-cDNA-Bibliothek aus menschlichem foetalem 
Gehirn (Human Fetal Brain 5'-STRETCH PLUS cDNA library; Lambda gt10; Cat. No. 
HL3003a; Clontech) eingesetzt. Es wurden 2x10* Lambda-Plaques mittels des 
radioaktiv markierten PCR-Fragments unter hochstringenten Bedingungen 
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(Sambrook et al. ( Molecular Cloning: A Laboratory Manual, Cold Spring Harbor 
Laboratory Press, 1989) abgesucht und 23 positive Klone gefunden und isoliert. 

Aus den positiven Lambda-gt1 0-Klonen wurden die entsprechenden cDNA- 
Fragmente mit EcoRI herausgeschnitten und in einen Bluescript-Vektor eingefiigt 
(Bluescript KS(+), Stratagene). Die Sequenzierung erfolgte mittels der Dideoxy- 
Kettenterminations-Methode (Sanger et al., Proc. Natl. Acad. Sci. USA 71, Seiten 
2163-2167, 1977), unter Verwendung eines kommerziellen Sequenzierkits (Sequi 
Therm long-read cycle sequencing kit-LC; Epicentre Technologies, Madison, Wl) und 
Bluescript-spezifischen Primern. 



In einer alternativen Sequenzier-Strategie wurden die cDNA-Fragmente der 
positiven Lambda-gt10-Klone, unter Verwendung Lambda-spezifischer Primer, mittels 
PCR amplifiziert. Die Sequenzierung wurde wie oben beschrieben durchgefuhrt. 

Die computerisierte Analyse der Sequenzen wurde mittels des 
Programmpakets GCG (Version 8.1, Unix; Silicon Graphics Inc.) durchgefuhrt. 

Man erhielt so die Nucleotid-Sequenz uber die voile Lange der cDNA von 
3350 Basenpaaren. Mit dem beschriebenen Verfahren der PCR-Klonierung konnen 
auch Varianten-Formen der Verbindungen der Formeln I oder II gefunden und isoliert 
werden, beispielsweise deren Allele, oder deren Splice-Varianten. Das beschriebene 
Verfahren des Absuchens einer cDNA-Bibliothek ermoglicht auch das Auffinden und 
die Isolierung von Verbindungen, welche unter stringenten Bedingungen an die 
codierenden Sequenzen der Formeln I oder II hybridisieren. 



- 13- 



Beispiel 3: 

NachweiS Cter codiert en Sequen zen der Verbindunaen 1 Oder II mittels 
Antikorpern 

Das mehr als 60 Aminosauren lange Prolin-reiche, basische Segment am 
Aminoterminus der codierten Sequenz der Verbindungen der Formeln I oder II eignet 
sich gut fur die Herstellung von Antikorpern mittels der Synthese von Peptiden und 
deren Einsatz zur Immunisierung. Wir haben aus dem Prolin-reichen, basischen 
Segment am Aminoterminus der codierten Sequenz der Verbindung der Formel II 
zwei Peptidsequenzen mit einer Lange von 19, respektive 13, Aminosauren zur 
Erzeugung von Antikorpern ausgewahlt. Die Peptide hatten folgen Sequenzen: 
Peptid 1 : H 2 N-SRS PLH RPH PSP PRS QX-CONH 2 
Peptid 2: H 2 N-LPS SRR PPR TPR F-COOH 

Die beiden Peptide wurden chemisch synthetisiert, an eine makromolekulare 
Tragersubstanz (Keyhole Limpet Hemacyanin) gekoppelt, und zur Immunisierung von 
2 Kaninchen injiziert. Die erzeugten Antiseren wiesen einen hohen Antikorper-Titer 
auf und konnten erfolgreich sowohl zur Identifizierung von nativem Neurotrypsin aus 
Gehirnextrakt der Maus als auch zur Identifizierung von recombinantem Neurotrypsin 
eingesetzt werden. Das angewandte Verfahren zur Erzeugung von Antikorpern kann 
auch zur Erzeugung von Antikorpern gegen die codierte Sequenz der Verbindung der 
Formel I angewendet werden. 

Die erzeugten Antikorper gegen die Teilsequenzen der codierten Sequenzen 
der Formeln I oder II konnen zur Aufspurung und zur Isolierung von Varianten- 
Formen der Verbindungen der Formeln I oder II, wie beispielsweise Allele oder 
Splice-Varianten, eingesetzt werden. Auch gentechnisch erzeugte Varianten der 
Verbindungen der Formeln I oder II konnen mit solchen Antikorpern aufgespurt und 
isoliert werden. 
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Beispiel 4: 



Pefniqung der codierten ftr wenzen der Verbindunr»»n H er Formem i n^r n 

Zur Reinigung der codierten Sequenzen der Verbindungen der Formeln I 
Oder II konnen, neben konventionellen chromatographischen Methoden, wie 
beispielsweise lonenaustauscher-Chromatograpohie, zwei affinitatschromatographi- 
sche Methoden eingesetzt werden. Eine der affinitatschromatographischen 
Reinigungsprozeduren basiert auf der VerfOgbarkeit von Antikorpern. Durch Kopplung 
der Antikorper an eine chromatographische Matrix kann ein Reinigungsverfahren 
erzeugt werden, das in einem Schritt einen sehr hohen Grad an Reinheit der 
entsprechenden Verbindung verspricht. 

Ein fiir die Reinigung der codierten Sequenzen der Verbindungen der 
Formeln I und II ebenfalls wichtiges Merkmal ist das Prolin-reiche, basische Segment 
am Aminoterminus. Es ist zu erwarten, dass, aufgrund der hohen Dichte an positiven 
Ladungen, dieses Segment die Bindung der codierten Sequenzen der Verbindungen 
der Formeln I oder II an Heparin und Heparin-ahnliche Affinitatsmatrices vermittelt. 
Dieses Prinzip ermdglicht auch die Isolierung, oder zumindest die Anreicherung von 
Varianten-Formen der codierten Sequenzen der Formeln I oder II, beispielsweise 
deren Allele oder Splice-Varianten. Gleichermassen kann die Heparin- 
Affinitatschromatographie auch zur Isolierung, oder zumindest zur Anreicherung, von 
spezieshomologen Proteinen der Verbindungen der Formeln I oder II eingesetzt 
werden. 



Nachfolgend werden Angaben zu den Verbindungen der Formeln I oder II 
gemacht. 




- 15- 

(1) ANGABEN ZUR VERBINDUNG PER FORMEL I (Neurotrvpsin des 
Menschenl 

(i) SEQUENZKENNZEICHEN: 

5 

(A) LANGE: 3350 Basenpaare 

(B) ART: Nucleinsaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

10 

(ii) ART DES MOLEKULS: c-DNA zu m-RNA 

(vi) URSPRONGLICHE HERKUNKFT: 

15 (A) ORGANISMUS: Homo sapiens 

(D) ENTWICKLUNGSSTADIUM: Foetalstadium 
(F) GEWEBETYP: Gehirn 

(vii) UNMITTELBARE HERKUNFT: 

20 

(A) BIBLIOTHEK: human fetal brain 5-stretch plus cDNA library in the lambda 

gt1 0 vector; catalog No. HL 3003a; clontech, Palo Alto, CA, 
USA. 

25 (B) CLONE: cDNA-Klone No.: 

3-1,3-2, 3-6, 3-7, 3-8, 3-10, 3-11,3-12 
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(ix) MERKMAL: 

(A) NAME/SCHLOSSEL: Signalpeptid 

(B) LAGE:44.. 103 



(ix) MERKMAL: 

(A) NAME/SCHLOSSEL: reifes Peptid 
10 (B) LAGE: 104 ..2668 





(ix) MERKMAL: 

15 (A) NAME/SCHLOSSEL: codierende Sequenz 
(B) LAGE: 44 .. 2668 



(ix) MERKMAL: 

20 

(A) NAME/SCHLOSSEL: Protein-reiches basisches Segment 

(B) LAGE: 104 ..319 0 



25 (ix) MERKMAL: 

(A) NAME/SCHLUSSEL: Kringle-Domane 

(B) LAGE: 320 .. 538 



30 
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(ix) MERKMAL: 

(A) NAME/SCHLClSSEL: SRCR-Domane 1 

(B) LAGE: 551 .. 856 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: SRCR-Domane 2 
10 (B) LAGE: 881 ..1186 



(ix) MERKMAL: 

15 (A) NAME/SCHLUSSEL: SRCR-Domane 3 
(B) LAGE: 1202.. 1504 



(ix) MERKMAL: 

20 

(A) NAME/SCHLUSSEL: SRCR-Domane 4 

(B) LAGE: 1541 .. 1846 



25 (ix) MERKMAL: 

(A) NAME/SCHLUSSEL: proteolytische Domane 

(B) LAGE: 1898 ..2668 



30 
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(ix) MERKMAL: 

(A) NAME/SCHLGSSEL: Histidin der katalytischen Triade 

(B) LAGE: 2069 - 2071 

5 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: Asparaginsaure der katalytischen Triade 
10 (B) LAGE: 2219 - 2221 

(ix) MERKMAL: 

15 (A) NAME/SCHLOSSEL: Serin der katalytischen Triade 

(B) LAGE: 251 6. .2518 



(ix) MERKMAL: 

20 

(A) NAME/SCHLUSSEL: PolyA-Signal 

(B) LAGE: 2873 .. 2878 





25 (ix) MERKMAL 

(A) NAME/SCHLUSSEL: PolyA-Signal 

(B) LAGE: 3034 .. 3039 



30 

(ix) 



MERKMAL: 



19- 



(A) NAME/SCHLUSSEL: PolyA-Signal 

(B) LAGE:3215.. 3220 



5 (ix) MERKMAL 

(A) NAME/SCHLOSSEL: 3'UTR 

(B) LAGE: 2669 .. 3350 

10 

(ix) MERKMAL 

(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE: 1 .. 43 
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Verbindung der Formel I (Neurotrypsin des Menschen) 



CGGAAGCTGG GGAGCATGGA CCAGACCCCG CAGCGCTGGC ACC ATG ACG CTC GCC 

Met Thr Leu Ala 
-20 

GT CTA GCC CTG ATG TTA GGG GCG CTC CCC GAA GTG GTC GGC 
Arg Phe Val Leu Ala Leu Met Leu Gly Ala Leu Pro Glu Val Val Gly 
" 15 -10 -5 -i 

TTT GAT TCT GTC CTC AAT GAT TCC CTC CAC CAC AGC CAC CGC CAT TCG 
Phe Asp Ser Val Leu Asn Asp Ser Leu His His Ser His Arg His Ser 
1 5 10 15 

CCC CCT GCG GGT CCG CAC TAC CCC TAT TAC CTT CCC ACC CAG CAG CGG 
Pro Pro Ala Gly Pro His Tyr Pro Tyr Tyr Leu Pro Thr Gin Gin Arg 
20 25 30 

CCC CCG ACG ACG CGT CCG CCG CCG CCT CTC CCG CGC TTC CCG CGC CCC 
Pro Pro Thr Thr Arg Pro Pro Pro Pro Leu Pro Arg Phe Pro Arg Pro 
35 40 45 



CCG CGG GCG CTC CCT GCC CAG CGC CCG CAC GCC CTC CAG GCC GGG CAC 
Pro Arg Ala Leu Pro Ala Gin Arg Pro His Ala Leu Gin Ala Gly His 
50 55 60 

ACG CCC CGG CCG CAC CCC TGG GGC TGC CCC GCC GGC GAG CCA TGG GTC 
Thr Pro Arg Pro His Pro Trp Gly Cys Pro Ala Gly Glu Pro Trp Val 
65 70 75 go 

AGC GTG ACG GAC TTC GGC GCC CCG TGT CTG CGG TGG GCG GAG GTG CCA 
Ser Val Thr Asp Phe Gly Ala Pro Cys Leu Arg Trp Ala Glu Val Pro 
85 90 95 

CCC TTC CTG GAG CGG TCG CCC CCA GCG AGC TGG GCT CAG CTG CGA GGA 
Pro Phe Leu Glu Arg Ser Pro Pro Ala Ser Trp Ala Gin Leu Arg Gly 
100 105 no 

CAG CGC CAC AAC TTT TGT CGG AGC CCC GAC GGC GCG GGC AGA CCC TGG 
Gin Arg His Asn Phe Cys Arg Ser Pro Asp Gly Ala Gly Arg Pro Trp 
115 120 125 

TGT TTC TAC GGA GAC GCC CGT GGC AAG GTG GAC TGG GGC TAC TGC GAC 
Cys Phe Tyr Gly Asp Ala Arg Gly Lys Val Asp Trp Gly Tyr Cys Asp 
130 135 140 

TGC AGA CAC GGA TCA GTA CGA CTT CGT GGC GGC AAA AAT GAG TTT GAA 
Cys Arg His Gly Ser Val Arg Leu Arg Gly Gly Lys Asn Glu Phe Glu 
145 150 155 i 6 o 

GGC ACA GTG GAA GTA TAT GCA ACT GGA GTT TGG GGC ACT GTC TGT AGC 
Gly Thr Val Glu Val Tyr Ala Ser Gly Val Trp Gly Thr Val Cys Ser 
165 170 175 

AGC CAC TGG GAT GAT TCT GAT GCA TCA GTC ATT TGT CAC CAG CTG CAG 
Ser His Trp Asp Asp Ser Asp Ala Ser Val He Cys His Gin Leu Gin 
180 185 190 



55 



103 



151 



199 



247 



295 



343 



391 



439 



487 



535 



583 



631 



679 
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CTG GGA GGA AAA GGA ATA GCA AAA CAA ACC CCG TTT TCT GGA CTG GGC 727 

Leu Gly Gly Lys Gly lie Ala Lys Gin Thr Pro Phe Ser Gly Leu Gly 
195 200 205 

CTT ATT CCC ATT TAT TGG AGC AAT GTC CGT TGC CGA GGA GAT GAA GAA 775 

Leu lie Pro lie Tyr Trp Ser Asn Val Arg Cys Arg Gly Asp Glu Glu 
210 215 220 

AAT ATA CTG CTT TGT GAA AAA GAC ATC TGG CAG GGT GGG GTG TGT CCT 82 3 

Asn He Leu Leu Cys Glu Lys Asp He Trp Gin Gly Gly Val Cys Pro 
225 230 235 240 

CAG AAG ATG GCA GCT GCT GTC ACG TGT AGC TTT TCC CAT GGC CCA ACG 871 

Gin Lys Met Ala Ala Ala Val Thr Cys Ser Phe Ser His Gly Pro Thr 

245 250 255 

TTC CCC ATC ATT CGC CTT GCT GGA GGC AGC AGT GTG CAT GAA GGC CGG 919 

Phe Pro He He Arg Leu Ala Gly Gly Ser Ser Val His Glu Gly Arg 
260 265 270 

GTG GAG CTC TAC CAT GCT GGC CAG TGG GGA ACC GTT TGT GAT GAC CAA 9 67 

Val Glu Leu Tyr His Ala Gly Gin Trp Gly Thr Val Cys Asp Asp Gin 
275 280 285 

TGG GAT GAT GCC GAT GCA GAA GTG ATC TGC AGG CAG CTG GGC CTC AGT 1015 

Trp Asp Asp Ala Asp Ala Glu Val He Cys Arg Gin Leu Gly Leu Ser 
290 295 300 

GGC ATT GCC AAA GCA TGG CAT CAG GCA TAT TTT GGG GAA GGG TCT GGC 10 6 3 

Gly He Ala Lys Ala Trp His Gin Ala Tyr Phe Gly Glu Gly Ser Gly 
305 310 315 320 

CCA GTT ATG TTG GAT GAA GTA CGC TGC ACT GGG AAT GAG CTT TCA ATT 1111 

Pro Val Met Leu Asp Glu Val Arg Cys Thr Gly Asn Glu Leu Ser He 

325 330 335 

GAG CAG TGT CCA AAG AGC TCC TGG GGA GAG CAT AAC TGT GGC CAT AAA 115 9 

Glu Gin Cys Pro Lys Ser Ser Trp Gly Glu His Asn Cys Gly His Lys 
340 345 350 

GAA GAT GCT GGA GTG TCC TGT ACC CCT CTA AC A GAT GGG GTC ATC AGA 12 07 

Glu Asp Ala Gly Val Ser Cys Thr Pro Leu Thr Asp Gly Val He Arg 
355 360 365 

CTT GCA GGT GGG AAA GGC AGC CAT GAG GGT CGC TTG GAG GTA TAT TAC 12 5 5 

Leu Ala Gly Gly Lys Gly Ser His Glu Gly Arg Leu Glu Val Tyr Tyr 
370 375 380 

AGA GGC CAG TGG GGA ACT GTC TGT GAT GAT GGC TGG ACT GAG CTG AAT 13 03 

Arg Gly Gin Trp Gly Thr Val Cys Asp Asp Gly Trp Thr Glu Leu Asn 
385 390 395 400 

ACA TAC GTG GTT TGT CGA CAG TTG GGA TTT AAA TAT GGT AAA CAA GCA 13 51 

Thr Tyr Val Val Cys Arg Gin Leu Gly Phe Lys Tyr Gly Lys Gin Ala 

405 410 415 

TCT GCC AAC CAT TTT GAA GAA AGC ACA GGG CCC ATA TGG TTG GAT GAC 13 9 9 

Ser Ala Asn His Phe Glu Glu Ser Thr Gly Pro He Trp Leu Asp Asp 
420 425 430 
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GTC AGC TGC TCA GGA AAG GAA ACC AGA TTT CTT CAG TGT TCC AGG CGA 1447 
Val Ser Cys Ser Gly Lys Glu Thr Arg Phe Leu Gin Cys Ser Arg Arg 
435 440 445 

CAG TGG GGA AGG CAT GAC TGC AGC CAC CGC GAA GAT GTT AGC ATT GCC 1495 
Gin Trp Gly Arg His Asp Cys Ser His Arg Glu Asp Val Ser He Ala 
450 455 460 

TGC TAC CCT GGC GGC GAG GGA CAC AGG CTC TCT CTG GGT TTT CCT GTC 1543 
Cys Tyr Pro Gly Gly Glu Gly His Arg Leu Ser Leu Gly Phe Pro Val 
465 470 475 480 

AGA CTG ATG GAT GGA GAA AAT AAG AAA GAA GGA CGA GTG GAG GTT TTT 1591 
Arg Leu Met Asp Gly Glu Asn Lys Lys Glu Gly Arg Val Glu Val Phe 
485 490 495 

ATC AAT GGC CAG TGG GGA ACA ATC TGT GAT GAT GGA TGG ACT GAT AAG 163 9 

He Asn Gly Gin Trp Gly Thr He Cys Asp Asp Gly Trp Thr Asp Lys 
500 505 510 

GAT GCA GCT GTG ATC TGT CGT CAG CTT GGC TAC AAG GGT CCT GCC AGA 1687 
Asp Ala Ala Val He Cys Arg Gin Leu Gly Tyr Lys Gly Pro Ala Arg 
515 520 525 

GCA AGA ACC ATG GCT TAC TTT GGA GAA GGA AAA GGA CCC ATC CAT GTG 17 3 5 

Ala Arg Thr Met Ala Tyr Phe Gly Glu Gly Lys Gly Pro He His Val 
530 535 540 

GAT AAT GTG AAG TGC ACA GGA AAT GAG AGG TCC TTG GCT GAC TGT ATC 17 83 

Asp Asn Val Lys Cys Thr Gly Asn Glu Arg Ser Leu Ala Asp Cys He 
545 550 555 560 

AAG CAA GAT ATT GGA AGA CAC AAC TGC CGC CAC AGT GAA GAT GCA GGA 1831 
Lys Gin Asp He Gly Arg His Asn Cys Arg His Ser Glu Asp Ala Gly 
565 570 575 

GTT ATT TGT GAT TAT TTT GGC AAG AAG GCC TCA GGT AAC AGT AAT AAA 187 9 

Val He Cys Asp Tyr Phe Gly Lys Lys Ala Ser Gly Asn Ser Asn Lys 
580 5 8 5 590 

GAG TCC CTC TCA TCT GTT TGT GGC TTG AGA TTA CTG CAC CGT CGG CAG 19 2 7 

Glu Ser Leu Ser Ser Val Cys Gly Leu Arg Leu Leu His Arg Arg Gin 
595 600 605 

AAG CGG ATC ATT GGT GGG AAA AAT TCT TTA AGG GGT GGT TGG CCT TGG 19 7 5 

Lys Arg He He Gly Gly Lys Asn Ser Leu Arg Gly Gly Trp Pro Trp 
61 0 615 620 

CAG GTT TCC CTC CGG CTG AAG TCA TCC CAT GGA GAT GGC AGG CTC CTC 2 02 3 

Gin Val Ser Leu Arg Leu Lys Ser Ser His Gly Asp Gly Arg Leu Leu 
625 630 635 640 

TGC GGG GCT ACG CTC CTG AGT AGC TGC TGG GTC CTC ACA GCA GCA CAC 2 071 

Cys Gly Ala Thr Leu Leu Ser Ser Cys Trp Val Leu Thr Ala Ala His 
645 650 655 

TGT TTC AAG AGG TAT GGC AAC AGC ACT AGG AGC TAT GCT GTT AGG GTT 2119 
Cys Phe Lys Arg Tyr Gly Asn Ser Thr Arg Ser Tyr Ala Val Arg Val 
660 665 670 
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GGA GAT TAT CAT ACT CTG GTA CCA GAG GAG TTT GAG GAA GAA ATT GGA 2167 
Gly Asp Tyr His Thr Leu Val Pro Glu Glu Phe Glu Glu Glu lie Gly 
675 680 685 

GTT CAA CAG ATT GTG ATT CAT CGG GAG TAT CGA CCC GAC CGC AGT GAT 2 215 

Val Gin Gin lie Val lie His Arg Glu Tyr Arg Pro Asp Arg Ser Asp 
690 695 700 

TAT GAC ATA GCC CTG GTT AGA TTA CAA GGA CCA GAA GAG CAA TGT GCC 22 63 

Tyr Asp lie Ala Leu Val Arg Leu Gin Gly Pro Glu Glu Gin Cys Ala 
705 710 715 720 

AGA TTC AGC AGC CAT GTT TTG CCA GCC TGT TTA CCA CTC TGG AGA GAG 2311 
Arg Phe Ser Ser His Val Leu Pro Ala Cys Leu Pro Leu Trp Arg Glu 
725 730 735 

AGG CCA CAG AAA AC A GCA TCC AAC TGT TAC ATA AC A GGA TGG GGT GAC 23 5 9 

Arg Pro Gin Lys Thr Ala Ser Asn Cys Tyr lie Thr Gly Trp Gly Asp 
740 745 750 

ACA GGA CGA GCC TAT TCA AGA ACA CTA CAA CAA GCA GCC ATT CCC TTA 2 4 07 

Thr Gly Arg Ala Tyr Ser Arg Thr Leu Gin Gin Ala Ala He Pro Leu 
755 760 765 

CTT CCT AAA AGG TTT TGT GAA GAA CGT TAT AAG GGT CGG TTT ACA GGG 24 5 5 

Leu Pro Lys Arg Phe Cys Glu Glu Arg Tyr Lys Gly Arg Phe Thr Gly 
770 775 780 

AGA ATG CTT TGT GCT GGA AAC CTC CAT GAA CAC AAA CGC GTG GAC AGC 2 5 03 

Arg Met Leu Cys Ala Gly Asn Leu His Glu His Lys Arg Val Asp Ser 
785 790 795 800 

TGC CAG GGA GAC AGC GGA GGA CCA CTC ATG TGT GAA CGG CCC GGA GAG 25 51 

Cys Gin Gly Asp Ser Gly Gly Pro Leu Met Cys Glu Arg Pro Gly Glu 
805 810 815 

AGC TGG GTG GTG TAT GGG GTG ACC TCC TGG GGG TAT GGC TGT GGA GTC 2 5 99 

Ser Trp Val Val Tyr Gly Val Thr Ser Trp Gly Tyr Gly Cys Gly Val 
820 825 830 

AAG GAT TCT CCT GGT GTT TAT ACC AAA GTC TCA GCC TTT GTA CCT TGG 2 6 47 

Lys Asp Ser Pro Gly Val Tyr Thr Lys Val Ser Ala Phe Val Pro Trp 
835 840 845 

ATA AAA AGT GTC ACC AAA CTG TAA TTCTTCATGG AAACTTCAAA GCAGCATTT 27 00 

He Lys Ser Val Thr Lys Leu * 
850 855 



AAACAAATGG AAAACTTTGA ACCCCCACTA TTAGCACTCA GCAGAGATGA CAACAAATGG 27 6 0 
CAAGATCTGT TTTTGCTTTG TGTTGTGGTA AAAAATTGTG TACCCCCTGC TGC TTTTG AG 2 82 0 
AAATTTGTGA ACATTTTCAG AGGCCTCAGT GTAGTGGAAG TGATAATCCT TAAATGAACA 2 8 80 



TTTTCTACCC TAATTTCACT GGAGTGACTT ATTCTAAGCC TCATCTATCC C C TAC C T ATT 29 40 
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TCTCAAAATC ATTCTATGCT GATTTTACAA AAGATCATTT TTACATTTGA ACTGAGAACC 3 000 

CCTTTTAATT GAATCAGTGG TGTCTGAAAT CATATTAAAT ACCCACATTT GACATAAATG 3 060 

CGGTACCCTT TACTACACTC ATGAGTGGCA TATTTATGCT TAGGTC TTTT CAAAAGACTT 3120 

GACAAGAAAT CTTCATATTC TCTGTAGCCT TTGTCAAGTG AGGAAATCAG TGGTTAAAGA 3180 

ATTCCACTAT AAAC TTTT AG GCCTGAATAG GAGTAGTAAA GCCTCAAGGA CATCTGCCTG 3240 

TCACAATATA TTCTCAAAGT GATCTGATAT TTGGAAACAA GTATCCTTGT TGAGTACCAA 3 300 

GTGCTACAGA AACCATAAGA TAAAAATACT TTCTACCTAC AGCGTGCCCG 3 3 50 
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(1) ANGABEN ZUR VERBIN DUNG PER FORMEL II (Neurotrvpsin der Maus^ 

(i) SEQUENZKENNZEICHEN: 

5 (A) LANGE: 2376 Basenpaare 

(B) ART: Nucleinsaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

10 (ii) ART DES MOLEKULS: c-DNA zu m-RNA 

(vi) URSPRUNGLICHE HERKUNKFT: 

(A) ORGANISMUS: Mus musculus 

15 (D) ENTWICKLUNGSSTADIUM: Postnatal-Tag 10 

(F) GEWEBETYP: Gehirn 

(G) ZELLTYP: Neuronen 



20 



25 



(vii) UNMITTELBARE HERKUNFT: 

(A) BIBLIOTHEK: mouse brain cDNA library in the lambda Uni-ZAP-XR vector, 

oligo (dT)-primed, from Balb c mice, postnatal day 20, 
Cat. No.. 937 319; Stratagene, La Jolla, CA, USA 



(B) CLONE: cDNA clone no. 1 6 

(vii) UNMITTELBARE HERKUNFT: 

30 (A) BIBLIOTHEK: mouse brain cDNA library in the Lambda gt1 0 vector, 

oligo(dT)- and random-primed, embryonic day 15, 
Cat. No. ML 3002a; Clontech, Palo Alto, CA, USA 
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5 



(B) CLONE: cDNA clone #25 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: Signalpeptid 

(B) LAGE: 24 .. 86 



10 (ix) MERKMAL: 

(A) NAME/SCHLUSSEL: reifes Peptid 

(B) LAGE: 87 .. 2306 



15 



20 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: codierende Sequenz 

(B) LAGE: 24 .. 2306 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: Protein-reiches basisches Segment 
25 (B) LAGE: 90 .. 275 



(ix) MERKMAL: 

30 (A) NAME/SCHLUSSEL: Kringle-Domane 
(B) LAGE: 276 .. 494 
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(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: SRCR-Domane 1 
5 (B) LAGE:519.. 824 



(ix) MERKMAL: 

10 (A) NAME/SCHLUSSEL: SRCR-Domane 2 
(B) LAGE: 840 .. 1142 



(ix) MERKMAL: 

15 

(A) NAME/SCHLUSSEL: SRCR-Domane 3 

(B) LAGE: 1179 .. 1484 



20 (ix) MERKMAL: 

(A) NAME/SCHLUSSEL: proteolytische Domane 

(B) LAGE: 1536.. 2306 

25 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: Histidin der katalytischen Triade 

(B) LAGE: 1707 .. 1709 

30 
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25 




(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: Asparaginsaure der katalytischen Triade 
5 (B) LAGE: 1857.. 1859 



(ix) MERKMAL: 

io (A) NAME/SCHLUSSEL: Serin der katalytischen Triade 

(B) LAGE: 2154 .. 2156 

(ix) MERKMAL: 

15 (A) NAME/SCHLGSSEL: PolyA-Signal 

(B) LAGE: 2324 .. 2329 und 2331 .. 2336 

(ix) MERKMAL: 

20 (A) NAME/SCHLUSSEL: PolyA-Bereich 

(B) LAGE: 2357 .. 2376 




(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: 3'UTR 

(B) LAGE: 2307 .. 2341 oder 2307 .. 2356 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE: 1 .. 23 
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Verbindung der Formel XX (Neurotrypsin der Maus) 



GGACCACACT CGGCGCCGCA GCC ATG GCG CTC GCC CGC TGC GTG CTG GCT GTG 

Met Ala Leu Ala Arg Cys Val Leu Ala Val 
-20 -is 

ATT TTA GGG GCA CTG TCT GTA GTG GCC CGC GCT GAT CCG GTC TCG CGC 
He Leu Gly Ala Leu Ser Val Val Ala Arg Ala Asp Pro Val Ser Arg 

TCT CCC CTT CAC CGC CCG CAT CCG TCC CCA CCG CGT TCC CAA CAC GCG 
Ser Pro Leu His Arg Pro His Pro Ser Pro Pro Arg Ser Gin His Ala 
10 15 20 

CAC TAC CTT CCC AGC TCG CGG CGG CCA CCC AGG ACC CCG CGC TTC CCG 
His Tyr Leu Pro Ser Ser Arg Arg Pro Pro Arg Thr Pro Arg Phe Pro 
25 30 35 

CTC CCG CTG CGG ATC CCC GCT GCC CAG CGC CCG CAG GTC CTC AGC ACC 
Leu Pro Leu Arg He Pro Ala Ala Gin Arg Pro Gin Val Leu Ser Thr 
40 45 50 

GGG CAC ACG CCC CCG ACG ATT CCA CGC CGC TGC GGG GCA GGA GAG TCG 
Gly His Thr Pro Pro Thr He Pro Arg Arg Cys Gly Ala Gly Glu Ser 
55 60 6 5 

TGG GGC AAT GCC ACC AAC CTC GGC GTC CCG TGT CTA CAC TGG GAC GAG 
Trp Gly Asn Ala Thr Asn Leu Gly Val Pro Cys Leu His Trp Asp Glu 
70 75 80 85 

GTG CCG CCC TTC CTG GAG CGG TCG CCC CCG GCC AGT TGG GCT GAG CTG 
Val Pro Pro Phe Leu Glu Arg Ser Pro Pro Ala Ser Trp Ala Glu Leu 
90 95 100 

CGA GGG CAG CCG CAC AAC TTC TGC CGG AGC CCG GAT GGC TCG GGC AGA 
Arg Gly Gin Pro His Asn Phe Cys Arg Ser Pro Asp Gly Ser Gly Arg 
105 110 us 

CCT TGG TGC TTC TAT CGG AAT GCC CAG GGC AAA GTA GAC TGG GGC TAC 
Pro Trp Cys Phe Tyr Arg Asn Ala Gin Gly Lys Val Asp Trp Gly Tyr 
120 125 130 

TGC GAT TGT GGT CAA GGC CCG GCG TTG CCC GTC ATT CGC CTT GTT GGT 
Cys Asp Cys Gly Gin Gly Pro Ala Leu Pro Val He Arg Leu Val Gly 
13 5 140 145 

GGG AAC AGT GGG CAT GAA GGT CGA GTG GAG CTG TAC CAC GCT GGC CAG 
Gly Asn Ser Gly His Glu Gly Arg Val Glu Leu Tyr His Ala Gly Gin 
150 155 160 Y 165 

TGG GGG ACC ATC TGT GAC GAC CAA TGG GAC AAT GCA GAC GCA GAC GTC 
Trp Gly Thr He Cys Asp Asp Gin Trp Asp Asn Ala Asp Ala Asp Val 
170 175 180 

ATC TGT AGG CAG CTG GGG CTC AGT GGC ATT GCC AAA GCA TGG CAT CAG 
He Cys Arg Gin Leu Gly Leu Ser Gly He Ala Lys Ala Trp His Gin 
18 5 190 195 
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GCA CAT TTT GGG GAA GGA TCT GGC CCA ATA TTG TTG GAT GAA GTA CGC 72 5 

Ala His Phe Gly Glu Gly Ser Gly Pro lie Leu Leu Asp Glu Val Arg 
200 205 210 

TGC ACC GGA AAC GAG CTG TCA ATT GAG CAA TGT CCA AAG AGT TCC TGG 773 
Cys Thr Gly Asn Glu Leu Ser He Glu Gin Cys Pro Lys Ser Ser Trp 
215 220 225 

GGC GAA CAT AAC TGT GGC CAT AAA GAA GAT GCT GGA GTG TCT TGT GTT 821 
Gly Glu His Asn Cys Gly His Lys Glu Asp Ala Gly Val Ser Cys Val 
230 235 240 245 

CCT CTA ACA GAT GGT GTC ATC AGA CTG GCA GGA GGA AAA AGT ACC CAT 8 69 

Pro Leu Thr Asp Gly Val He Arg Leu Ala Gly Gly Lys Ser Thr His 
250 255 260 

GAA GGT CGC CTG GAG GTC TAC TAC AAG GGG CAG TGG GGG ACA GTC TGT 917 
Glu Gly Arg Leu Glu Val Tyr Tyr Lys Gly Gin Trp Gly Thr Val Cys 
265 270 275 

GAT GAT GGC TGG ACT GAG ATG AAC ACA TAC GTG GCT TGT CGA CTG CTG 9 65 

Asp Asp Gly Trp Thr Glu Met Asn Thr Tyr Val Ala Cys Arg Leu Leu 
280 285 290 

GGA TTT AAA TAC GGC AAA CAG TCC TCT GTG AAC CAT TTT GAT GGC AGC 1013 
Gly Phe Lys Tyr Gly Lys Gin Ser Ser Val Asn His Phe Asp Gly Ser 
295 300 305 

AAC AGG CCC ATA TGG CTG GAT GAC GTC AGC TGC TCA GGA AAA GAA GTC 10 61 

Asn Arg Pro He Trp Leu Asp Asp Val Ser Cys Ser Gly Lys Glu Val 
310 315 320 325 

AGC TTC ATT CAG TGT TCC AGG AGA CAG TGG GGA AGG CAT GAC TGC AGC 110 9 

Ser Phe He Gin Cys Ser Arg Arg Gin Trp Gly Arg His Asp Cys Ser 
330 335 340 

CAT AGA GAA GAT GTG GGC CTC ACC TGC TAT CCT GAC AGC GAT GGA CAT 115 7 

His Arg Glu Asp Val Gly Leu Thr Cys Tyr Pro Asp Ser Asp Gly His 
345 350 355 

AGG CTT TCT CCA GGT TTT CCC ATC AGA CTA GTG GAT GGA GAG AAT AAG 12 0 5 

Arg Leu Ser Pro Gly Phe Pro He Arg Leu Val Asp Gly Glu Asn Lys 
360 365 370 

AAG GAA GGA CGA GTG GAG GTT TTT GTC AAT GGC CAA TGG GGA ACA ATC 12 5 3 

Lys Glu Gly Arg Val Glu Val Phe Val Asn Gly Gin Trp Gly Thr He 
375 380 385 

TGC GAT GAC GGA TGG ACC GAT AAG CAT GCA GCT GTG ATC TGC CGG CAA 13 01 

Cys Asp Asp Gly Trp Thr Asp Lys His Ala Ala Val He Cys Arg Gin 
390 395 400 405 

CTT GGC TAT AAG GGT CCT GCC AGA GCA AGG ACT ATG GCT TAT TTT GGG 13 4 9 

Leu Gly Tyr Lys Gly Pro Ala Arg Ala Arg Thr Met Ala Tyr Phe Gly 
410 415 420 

GAA GGA AAA GGC CCC ATC CAC ATG GAT AAT GTG AAG TGC ACA GGA AAT 13 97 

Glu Gly Lys Gly Pro He His Met Asp Asn Val Lys Cys Thr Gly Asn 
425 430 435 
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GAG AAG GCC CTG GCT GAC TGT GTC AAA CAA GAC ATT GGA AGG CAC AAC 1445 
Glu Lys Ala Leu Ala Asp Cys Val Lys Gin Asp He Gly Arg His Asn 
440 445 450 

TGC CGC CAC AGT GAG GAT GCA GGA GTC ATC TGT GAC TAT TTA GAG AAG 149 3 

Cys Arg His Ser Glu Asp Ala Gly Val He Cys Asp Tyr Leu Glu Lys 
455 460 465 

AAA GCA TCA AGT AGT GGT AAT AAA GAG ATG CTC TCA TCT GGA TGT GGA 1541 
Lys Ala Ser Ser Ser Gly Asn Lys Glu Met Leu Ser Ser Gly Cys Gly 
470 475 480 485 

CTG AGG TTA CTG CAC CGT CGG CAG AAA CGG ATC ATT GGT GGG AAC AAT 1589 
Leu Arg Leu Leu His Arg Arg Gin Lys Arg He He Gly Gly Asn Asn 
490 495( 500 

TCT TTA AGG GGT GCC TGG CCT TGG CAG GCT TCC CTC AGG CTG AGG TCG 1637 
Ser Leu Arg Gly Ala Trp Pro Trp Gin Ala Ser Leu Arg Leu Arg Ser 
505 510 515 

GCC CAT GGA GAC GGC AGG CTG CTT TGT GGA GCT ACC CTT CTG AGT AGC 16 85 

Ala His Gly Asp Gly Arg Leu Leu Cys Gly Ala Thr Leu Leu Ser Ser 
520 525 530 

TGC TGG GTC CTG ACA GCT GCA CAC TGC TTC AAA AGG TAC GGA AAC AAC 1733 
Cys Trp Val Leu Thr Ala Ala His Cys Phe Lys Arg Tyr Gly Asn Asn 
535 540 545 

TCG AGG AGC TAT GCA GTT CGA GTT GGG GAT TAT CAT ACT CTG GTC CCA 17 81 

Ser Arg Ser Tyr Ala Val Arg Val Gly Asp Tyr His Thr Leu Val Pro 
550 555 560 565 

GAG GAG TTT GAA CAA GAA ATA GGG GTT CAA CAG ATT GTG ATT CAC AGG 182 9 

Glu Glu Phe Glu Gin Glu He Gly Val Gin Gin He Val He His Arg 
570 575 580 

AAC TAC AGG CCA GAC AGA AGC GAC TAT GAC ATT GCC CTG GTT AGA TTG 1877 
Asn Tyr Arg Pro Asp Arg Ser Asp Tyr Asp He Ala Leu Val Arg Leu 
585 590 595 

CAA GGA CCA GGG GAG CAA TGT GCC AGA CTA AGC ACC CAC GTT TTG CCA 192 5 

Gin Gly Pro Gly Glu Gin Cys Ala Arg Leu Ser Thr His Val Leu Pro 
600 605 610 

GCC TGT TTA CCT CTA TGG AGA GAG AGG CCA CAG AAA ACA GCC TCC AAC 197 3 

Ala Cys Leu Pro Leu Trp Arg Glu Arg Pro Gin Lys Thr Ala Ser Asn 
615 620 625 

TGT CAC ATA ACA GGA TGG GGA GAC ACA GGT CGT GCC TAC TCA AGA ACT 2 021 

Cys His He Thr Gly Trp Gly Asp Thr Gly Arg Ala Tyr Ser Arg Thr 
630 635 640 645 



CTA CAA CAA GCT GCT GTG CCT CTG TTA CCC AAG AGG TTT TGT AAA GAG 
Leu Gin Gin Ala Ala Val Pro Leu Leu Pro Lys Arg Phe Cys Lys Glu 
650 655 660 



2069 



AGG TAC AAG GGA CTA TTT ACT GGG AGA ATG CTC TGT GCT GGG AAC CTC 2117 
Arg Tyr Lys Gly Leu Phe Thr Gly Arg Met Leu Cys Ala Gly Asn Leu 
665 670 675 
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CAA GAA GAC AAC CGT GTG GAC AGC TGC CAG GGA GAC AGT GGA GGA CCA 2165 
Gin Glu Asp Asn Arg Val Asp Ser Cys Gin Gly Asp Ser Gly Gly Pro 
680 685 690 

CTC ATG TGT GAA AAG CCT GAT GAG TCC TGG GTT GTG TAT GGG GTG ACT 2 213 

Leu Met Cys Glu Lys Pro Asp Glu Ser Trp Val Val Tyr Gly Val Thr 
695 700 705 

TCC TGG GGG TAT GGA TGT GGA GTC AAA GAC ACT CCT GGA GTT TAT ACC 2 2 61 

Ser Trp Gly Tyr Gly Cys Gly Val Lys Asp Thr Pro Gly Val Tyr Thr 
710 715 720 725 

AGA GTC CCC GCT TTT GTA CCT TGG ATA AAA AGT GTC ACC AGT CTG 2 3 06 

Arg Val Pro Ala Phe Val Pro Trp lie Lys Ser Val Thr Ser Leu 
730 735 740 

TAACTTATGG AAAGCTCAAG AAATAGTAAA ACAGTAACTA TTCAGTCTTC AAAAAAAAAA 236 6 

AAAAAAAAAA 2 37 6 
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1 . Neurotrypsine der Formein I und II 



I: Neurotrypsin des Menschen 



II: Neurotrypsin der Maus 

einschliesslich der separaten, codierenden und codierten Sequenzen 
dieser Verbindungen der Formein I oder II, einschliesslich der separaten 
Teilsequenzen der codierenden und codierten Sequenzen dieser Verbindungen der 
Formein I oder II, wie zum Beispiel die codierenden und codierten Sequenzen der 
katalytischen Domanen der Verbindungen der Formein I oder II, einschliesslich der 
codierenden oder codierten Sequenzen oder Teilsequenzen der den Verbindungen 
der Formein I oder II entsprechenden Splice- Varianten, einschliesslich der 
codierenden oder codierten Sequenzen oder Teilsequenzen der den Verbindungen 
der Formein I oder II entsprechenden Allele, einschliesslich aller Sequenzvarianten 
der codierenden oder codierten Sequenzen, oder Teilen davon, der Verbindungen 
der Formein I oder II, deren biologische Aktivitat derjenigen der Verbindungen der 
Formein I oder II gleich oder ahnlich ist, beispielsweise Sequenzvarianten der 
Verbindungen der Formein I oder II, welche an den nicht konservierten 
Aminosauresequenzpositionen von der Sequenz der Formein I oder II abweichen, 
einschliesslich der an die codierenden Sequenzen, oder Teile davon, unter 
stringenten Bedingungen hybridisierenden Sequenzen, einschliesslich der 
Translationsprodukte der an die codierenden Sequenzen der Verbindungen der 
Formein I oder II, oder an Teile davon, unter stringenten Bedingungen 
hybridisierenden Sequenzen, einschliesslich der Nucleotidsequenzen, welche die 
durch die Verbindungen der Formein I oder II codierten Proteine, oder Teile davon, 
codieren, aber, als Resultat unterschiedlicher Verwendung alternativer Codons, 
degeneriert sind bezuglich der als Verbindungen der Formel I oder II definierten 
Nucleotidsequenzen. 



2. Medikament, dadurch gekennzeichnet, dass es als wenigstens ei 



aktive Verbindung entwecler die codierte Sequenz oder die codierende Sequenz der 
Verbindung der Formel I oder der Formel II, oder die separaten Teilsequenzen der 
codierten und codierenden Sequenzen dieser Verbindungen der Formel I oder II, wie 
zum Beispiel die codierenden oder codierten Sequenzen der katalytischen Domanen, 
enthalt, einschliesslich der codierenden oder codierten Sequenzen oder 
Teilsequenzen der den Verbindungen der Formeln I oder II entsprechenden Splice- 
Varianten, einschliesslich der codierenden oder codierten Sequenzen oder 
Teilsequenzen der den Verbindungen der Formeln I oder II entsprechenden Allele, 
einschliesslich aller Sequenzvarianten, der codierenden oder codierten Sequenzen, 
oder Teilen davon, der Verbindungen der Formeln I oder II, deren biologische 
Aktivitat derjenigen der Verbindungen der Formeln I oder II gleich oder ahnlich ist, 
beispielsweise Sequenzvarianten der Verbindungen der Formeln I oder II, welche an 
den nicht konservierten Aminosauresequenzpositionen von der Sequenz der 
Formeln I oder II abweichen, einschliesslich der an die codierenden Sequenzen, oder 
Teile davon, unter stringenten Bedingungen hybridisierenden Sequenzen, 
einschliesslich der Translationsprodukte der an die codierenden Sequenzen der 
Verbindungen der Formeln I oder II, oder an Teile davon, unter stringenten 
Bedingungen hybridisierenden Sequenzen, einschliesslich der Nucleotidsequenzen, 
welche die durch die Verbindungen der Formeln I oder II codierten Proteine, oder 
Teile davon, codieren, aber, als Resultat unterschiedlicher Verwendung alternativer 
Codons, degeneriert sind bezuglich der als Verbindungen der Formel I oder II 
definierten Nucleotidsequenzen. 

3. Medikament, dadurch gekennzeichnet, dass es als wenigstens eine 
aktive Verbindung eine Substanz enthalt, welche die Funktion der codierten Sequenz 
der Verbindungen der Formeln I oder II verandert, zum Beispiel, indem es die 
katalytische Wirkung des codierten Proteins, oder eines Teils davon, vermindert oder 
verstarkt, oder indem es die Verweildauer des codierten Proteins an dessen 
Wirkungsort im Korper verkurzt oder verlangert. 

4. Medikament, dadurch gekennzeichnet, dass es als wenigstens eine 
aktive Verbindung eine Substanz enthalt, welche die Expression der codierenden 
oder codierten Sequenzen der Verbindungen der Formel I oder II verandert, zum 



Beispiel indem es die Transkription der mRNA fordert Oder hemmt, oder indem es die 
Translation der codierten Sequenzen der Formeln I oder II fordert oder hemmt. 

5. Medikament nach Anspruch 2, 3 oder 4, dadurch gekennzeichnet, dass 
es die Apoptose von Zellen des Nervensystems verhindert. 

6. Medikament nach Anspruch 5, dadurch gekennzeichnet, dass es sich bei 
der Apoptose urn Apoptose im Zusammenhang mit Schadigungen des 
Nervengewebes handelt, wie beispielsweise Gehirninfarkt, oder Gehirnblutung, oder 
Gehirntrauma. 

7. Medikament nach Anspruch 5, dadurch gekennzeichnet, dass es sich bei 
der Apoptose urn Apoptose im Zusammenhang mit Schadigungen des 
Nervengewebes handelt, welche auf Grund von Sauerstoffmangel oder von 
Vergiftungen auftreten. 

8. Medikament nach Anspruch 2, 3 oder 4, dadurch gekennzeichnet, dass 
es die Regeneration von verletztem, beschadigtem, unterentwickeltem, oder 
fehlentwickeltem Gehirn- und/oder Nervengewebe beeinflusst. 

9. Medikament nach Anspruch 2, 3 oder 4, dadurch gekennzeichnet, dass 
es nach Gehirn- und/oder Nervenverletzungen oder nach der Zerstorung oder 
Beschadigung von Gehirnarealen die Reorganisation von intakt gebliebenen Gehirn-, 
respektive Nervenarealen fordert. 

10. Medikament nach Anspruch 2, 3 oder 4, dadurch gekennzeichnet, dass 
es pathologische Schmerzzustande verhindert, lindert oder behebt. 

1 1 . Medikament nach Anspruch 2, 3 oder 4, dadurch gekennzeichnet, dass 
es zur Forderung der Gehirnleistung bei gesunden Personen, sowie bei Personen mit 
reduzierter Gehirnleistung beitragt. 

12. Medikament nach Anspruch 2, 3 oder 4, dadurch gekennzeichnet, dass 



es Lern- und Gedachtnisfunktionen bei gesunden Personen, sowie bei Personen mit 
reduzierten Lern- und Gedachtnisfunktionen verbessert. 

13. Medikament nach Anspruch 2, 3 oder 4, dadurch gekennzeichnet, dass 
es Storungen aus dem Formenkreis der Storungen des psychischen Wohlbefindens, 
oder der psychosomatischen Befindlichkeit, wie beispielsweise Nervositat oder 
"Innere Unruhe", lindert oder behebt. 

14. Medikament nach Anspruch 2, 3 oder 4, dadurch gekennzeichnet, dass 
es Storungen im Bereich der emotionellen Funktionen, wie zum Beispiel 
Angstzustande, lindert oder behebt. 

15. Medikament nach Anspruch 2, 3 oder 4, dadurch gekennzeichnet, dass 
es psychiatrische Storungen lindert oder behebt. 

16. Medikament nach Anspruch 15, dadurch gekennzeichnet, dass es sich 
um eine Storung aus dem Formenkreis der Schizophrenie und schizophrenieartiger 
Storungen handelt, einschliesslich chronischer Schizophrenie, chronischer schizo- 
affektiver Storungen, unspezifischer Storungen, einschliesslich akuter und 
chronischer Schizophrenie verschiedener Auspragung, wie beispielsweise schwere, 
nicht-remittierende "Kraepelinsche" Schizophrenie, oder wie beispielsweise der DSM- 
lll-R-Prototyp der schizophrenieartigen Storungen, einschliesslich episodischer 
schizophrener Storungen, einschliesslich wahnhafter schizophrenieartiger Storungen, 
einschliesslich Schizophrenie-ahnlicher Personlichkeitsstorungen, wie beispielsweise 
schizophrenieartiger Peronlichkeitsstorungen mit milderer Symptomatik, 
einschliesslich schizotypischer Personlichkeitsstorungen, einschliesslich der latenten 
Formen schizophrener oder schizophrenieartiger Storungen, einschliesslich nicht- 
organischer psychotischer Storungen. 

17. Medikament nach Anspruch 15, dadurch gekennzeichnet, dass es sich 
um Storungen aus dem Formenkreis der endogenen Depressionen oder aus dem 
Formenkreis der manischen und manisch-depressiven Storungen handelt. 



18. Medikament nach Anspruch 2, 3 oder 4, dadurch gekennzeichnet, dass 
es durch mangelhafte oder uberfunktionelle Proteasen bedingte Storungen der 
Gehirnfunktion lindert oder behebt. 

19. Medikament nach Anspruch 18, dadurch gekennzeichnet, dass die 
Protease Gewebe-Plasminogenaktivator, abgekiirzt mit tPA, Urokinase- 
Plasminogenaktivator, abgekiirzt mit uPA, oder Plasmin ist. 

20. Medikament nach Anspruch 2, 3 oder 4, dadurch gekennzeichnet, dass 
es durch mangelhafte oder uberfunktionelle Proteasen bedingte Storungen der 
Lungenfunktion lindert oder behebt. 

21. Medikament nach Anspruch 20, dadurch gekennzeichnet, dass es sich 
bei der Storung der Lungenfunktion urn chronische Bronchitis oder Lungenemphysem 
handelt. 

22. Verwendung der codierenden Nucleotidsequenzen der Verbindungen der 
Formeln I oder II, einschliesslich der separaten Teilsequenzen der codierenden 
Sequenzen der Verbindungen der Formeln I oder II, wie zum Beispiel die codierenden 
Sequenzen der katalytischen Domanen der Verbindungen der Formeln I oder II, 
einschliesslich der codierenden Nucleotidsequenzen oder Teilsequenzen der den 
Verbindungen der Formeln I oder II entsprechenden Splice-Varianten, einschliesslich 
der codierenden Sequenzen, oder Teilsequenzen davon, der den Verbindungen der 
Formeln I oder II entsprechenden Allele, einschliesslich aller Sequenzvarianten der 
codierenden Sequenzen, oder Teilen davon, der Verbindungen der Formeln I oder II, 
deren Translationsprodukte bezuglich ihrer biologischen Aktivitat den 
Translationsprodukten der Verbindungen der Formeln I oder II gleich oder ahnlich 
sind, beispielsweise Sequenzvarianten der Verbindungen der Formeln I oder II, 
welche an den nicht konservierten Aminosauresequenzpositionen von der Sequenz 
der Formeln I oder II abweichen, einschliesslich der an die codierenden Sequenzen 
der Verbindungen der Formeln I oder II, oder an Teile davon, unter stringenten 
Bedingungen hybridisierenden Sequenzen, einschliesslich der Nucleotid-Sequenzen, 
welche die durch die Verbindungen der Formeln I oder II codierten Proteine, oder 
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Teile davon, codieren, aber, als Resultat unterschiedlicher Verwendung alternativer 
Codons, degeneriert sind bezuglich der als Verbindungen der Forme! I oder II 
definierten Nucleotidsequenzen, fur die Herstellung recombinanter Proteine. 

23. Verwendung von Proteinen mit den codierten Aminosauresequenzen der 
Verbindungen der Formeln I oder ll f einschliesslich der Proteine mit den separaten 
Teilsequenzen der codierten Aminosauresequenzen der Verbindungen der Formeln I 
oder II, wie beispielsweise die separaten katalytischen Domanen der Verbindungen 
der Formeln I oder II, einschliesslich der Proteine mit den codierten Sequenzen oder 
Teilsequenzen der den Verbindungen der Formeln I oder II entsprechenden Splice- 
Varianten, einschliesslich der Proteine mit den codierten Aminosauresequenzen, oder 
Teilsequenzen davon, der den Verbindungen der Formeln I oder II entsprechenden 
Allele, einschliesslich aller Sequenzvarianten der codierten Sequenzen, oder Teilen 
davon, der Verbindungen der Formeln I oder II, deren biologische Aktivitat derjenigen 
15 der codierten Sequenzen der Verbindungen der Formeln I oder II gleich oder ahnlich 
ist, beispielsweise Sequenzvarianten der Verbindungen der Formeln I oder II, welche 
an den nicht konservierten Aminosauresequenzpositionen von der Sequenz der 
Formeln I oder II abweichen, einschliesslich der Proteine mit den codierten 
Aminosauresequenzen, oder Teilsequenzen davon, der an die codierenden 
20 Sequenzen der Verbindungen der Formeln I oder II, oder an Teile davon, unter 
stringenten Bedingungen hybridisierenden Sequenzen, als Zielstruktur fur die 
Entwicklung von Pharmaca, zum Beispiel zur Hemmung oder Forderung der 
katalytischen Wirkung der codierten Proteine der Formeln I oder II. 



25 24 - Verwendung der Spezies-homologen Proteine, oder Teilen davon, der 

Verbindungen der Formeln I oder II, wie beispielsweise die Spezies-homologen 
Proteine der Ratte, des Kaninchens, des Rindes, des Schafes, des Schweins, der 
Primaten, der Vogel, des Zebrafisches, der Taufliege (Drosophila melanogaster), etc., 
einschliesslich der Teilsequenzen davon, wie beispielsweise die separaten 

30 katalytischen Domanen, einschliesslich der Splice-Varianten der Spezies-homologen 
Proteine, einschliesslich der Allele der Spezies-homologen Proteine, einschliesslich 
der Translationsprodukte der an die codierenden Sequenzen oder Teilsequenzen der 
den Verbindungen der Formeln I oder II entsprechenden Spezies-homologen 
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Verbindungen, oder deren Splice- Varianten, oder deren Allele, unter stringenten 
Verbindungen hybridisierenden Sequenzen, als Zielstruktur fur die Entwicklung von 
Pharmaca, zum Beispiel zur Forderung oder Hemmung der katalytischen Wirkung der 
codierten Proteine der Formeln I oder II. 

25. Verwendung der Proteine mit den codierten Aminosauresequenzen der 
Verbindungen der Formeln I oder II, einschliesslich der Proteine mit den separaten 
Teilsequenzen der codierten Aminosauresequenzen der Verbindungen der Formeln I 
oder II, wie beispielsweise die separaten katalytischen Domanen, einschliesslich der 
Proteine mit den codierten Sequenzen oder Teilsequenzen der den Verbindungen der 
Formeln I oder II entsprechenden Splice-Varianten, einschliesslich der Proteine mit 
den codierten Aminosauresequenzen, oder Teilsequenzen davon, der den 
Verbindungen der Formeln I oder II entsprechenden Allele, einschliesslich aller 
Sequenzvarianten der codierten Sequenzen, oder Teilen davon, der Verbindungen 
der Formeln I oder II, deren biologische Aktivitat derjenigen der codierten Sequenzen 
der Verbindungen der Formeln I oder II gleich oder ahnlich ist, beispielsweise 
Sequenzvarianten der Verbindungen der Formeln I oder II, welche an den nicht 
konservierten Aminosauresequenzpositionen von der Sequenz der Formeln I oder II 
abweichen, einschliesslich der Translationsprodukte der an die codierenden 
Sequenzen der Verbindungen der Formel I oder II, oder an Teile davon, unter 
stringenten Bedingungen hybridisierenden Sequenzen, einschliesslich der Spezies- 
homologen Proteine der Verbindungen der Formeln I oder II, wie beispielsweise die 
Spezies-homologen Proteine der Ratte, des Kaninchens, des Rindes, des Schafes, 
des Schweins, der Primaten, der Vogel. des Zebrafisches, der Taufliege (Drosophila 
melanogaster), etc., einschliesslich der Teilsequenzen davon, wie beispielsweise die 
separaten katalytischen Domanen, fur die Raumstrukturbestimmung, zum Beispiel 
der Raumstrukturbestimmung mittels Kristallographie oder Kernresonanz- 
spekroskopie. 



30 26. Verwendung der codierten Aminosauresequenzen der Verbindungen der 

Formeln I oder II, einschliesslich der separaten Teilsequenzen der codierten 
Aminosauresequenzen der Verbindungen der Formeln I oder II, wie beispielsweise 
die codierten Aminosauresequenzen der separaten katalytischen Domanen der 



Verbindungen der Formeln I oder II, einschliesslich der codierten Sequenzen oder 
Teilsequenzen der den Verbindungen der Formeln I oder II entsprechenden Splice- 
Varianten, einschliesslich der codierten Aminosauresequenzen, oder Teilen davon, 
der den Verbindungen der Formeln I oder II entsprechenden Allele, einschliesslich 
aller Sequenzvarianten der codierten Sequenzen, oder von Teilen davon, der 
Verbindungen der Formeln I oder II, deren biologische Aktivitat derjenigen der 
codierten Sequenzen der Verbindungen der Formeln I oder II gleich oder ahnlich ist, 
beispielsweise Sequenzvarianten der Verbindungen der Formeln I oder II, welche an 
den nicht konservierten Aminosauresequenzpositionen von der Sequenz der 
Formeln I oder II abweichen, einschliesslich der Aminosauresequenzen der 
Translationsprodukte der an die codierenden Sequenzen der Verbindungen der 
Formeln I oder II, oder an Teile davon, unter stringenten Bedingungen 
hybridisierenden Sequenzen, einschliesslich der Sequenzen der Spezies-homologen 
Verbindungen der Verbindungen der Formeln I oder II, wie beispielsweise die 
Sequenzen der Spezies-homologen Verbindungen der Ratte, des Kaninchens, des 
Rindes, des Schafes, des Schweins, der Primaten, der Vogel, des Zebrafisches, der 
Taufliege (Drosophila melanogaster), etc.) einschliesslich der Teilsequenzen der 
Spezies-homologen Verbindungen, wie beispielsweise die Sequenzen der 
katalytischen Domane der Spezies-homologen Verbindungen, fur Vorhersagen der 
Proteinstruktur mittels computerisierter Proteinstruktur-Vorhersage-Verfahren. 

27. Verwendung der Raumstruktur der codierten Aminosauresequenzen der 
Verbindungen der Formeln I oder II, einschliesslich der Raumstrukturen der 
separaten Teilsequenzen der Verbindungen der Formeln I oder II, wie beispielsweise 
die Raumstruktur der katalytischen Domane, einschliesslich der Raumstruktur der 
codierten Sequenzen oder Teilsequenzen der den Verbindungen der Formeln I oder 
II entsprechenden Splice-Varianten, einschliesslich der Raumstruktur der codierten 
Sequenzen, oder Teilsequenzen, der den Verbindungen der Formeln I oder II 
entsprechenden Allele, einschliesslich der Raumstruktur aller Sequenzvarianten der 
codierten Sequenzen, oder von Teilen davon, der Verbindungen der Formeln I oder 
II, deren biologische Aktivitat derjenigen der codierten Sequenzen der Verbindungen 
der Formeln I oder II gleich oder ahnlich ist, beispielsweise Sequenzvarianten der 
Verbindungen der Formeln I oder II, welche an den nicht konservierten 
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Aminosauresequenzpositionen von der Sequenz der Forrneln I oder II abweichen, 
einschliesslich der Raumstrukturen der Translationsprodukte der an die codierenden 
Sequenzen der Verbindungen der Formein I oder II, oder an Telle davon, unter 
stringenten Bedingungen hybridisierenden Sequenzen, einschliesslich der 
Raumstrukturen der Spezies-homologen Verbindungen der Verbindungen der 
Formein I oder II, wie beispielsweise die Raumstruktur der Spezies-homologen 
Verbindungen, oder von Teilen davon, der Rate, des Kaninchens, des Rindes, des 
Schafes, des Schweins, der Primaten, der VAgel, des Zebraf. scries, der Taufliege 
(Drosophila melanogaster), etc., als Zielstruktur fur die Entwicklung von Pharmaca, 
zum Beispiel zur Hemmung oder Forderung der katalytischen Wirkung der codierten 
Proteine der Formein I oder II. 



15 



20 



25 



30 



28. Verwendung der codierenden Nucleotidsequenzen der Verbindungen der 
Formein I oder II, einschliesslich der separaten Teilsequenzen der codierenden 
Sequenzen dieser Verbindungen der Formein I oder II, wie zum Beispiel die 
codierenden Sequenzen der katalytischen Domanen der Verbindungen der Formein I 
oder II, einschliesslich der codierenden Sequenzen oder Teilsequenzen der den 
Verbindungen der Formein I oder II entsprechenden Splice-Varianten, einschliesslich 
der codierenden Sequenzen, oder Teilsequenzen, der den Verbindungen der Formein 
I oder II entsprechenden Allele, einschliesslich aller Sequenzvarianten der 
codierenden Sequenzen, oder von Teilen davon, der Verbindungen der Formein I 
oder II, deren Translationsprodukte in ihrer biologischen Aktivitat denjenigen der 
Verbindungen der Formein I oder II gleich oder ahnlich sind, beispielsweise 
Sequenzvarianten der Verbindungen der Formein I oder II, welche an den nicht 
konservierten Aminosauresequenzpositionen von der Sequenz der Verbindungen der 
Formein I oder li abweichen, einschliesslich der an die codierenden Sequenzen, oder 
an Teile davon, unter stringenten Bedingungen hybridisierenden Sequenzen 
einschliessiich der Nucleotidsequenzen, welche die durch die Verbindungen der 
Formein I oder II codierten Proteine, oder Teile davon, codieren, aber, als Resultat 
unterschiedlicher Verwendung alternative Codons, degeneriert sind beziiglich der als 
Verb.ndungen der Formel I oder II definierten Nucleotidsequenzen in 
gentherapeutischen Anwendungen bei Menschen und bei Tieren, wie beispielsweise 
als Tetfe von Gentherapie-Vektoren oder wie beispielsweise als Teile von kunstlichen 



Chromosomen. 



29. Verwendung der codierenden Nucleotidsequenzen der Verbindungen der 
Formeln I oder II, einschliesslich der separaten Teilsequenzen der codierenden 
Sequenzen dieser Verbindungen der Formeln I oder II, wie zum Beispiel die 
codierenden Sequenzen der katalytischen Domanen der Verbindungen der Formeln I 
oder II, einschliesslich der codierenden Sequenzen oder Teilsequenzen der den 
Verbindungen der Formeln I oder II entsprechenden Splice- Varianten, einschliesslich 
der codierenden Sequenzen oder Teilsequenzen der den Verbindungen der Formeln I 
oder II entsprechenden Allele, einschliesslich aller Sequenzvarianten der codierenden 
Sequenzen, oder von Teilen davon, der Verbindungen der Formeln I oder II, deren 
Translationsprodukte in ihrer biologischen Aktivitat denjenigen der Verbindungen der 
Formeln I oder II gleich oder ahnlich sind, beispielsweise Sequenzvarianten der 
Verbindungen der Formeln I oder II, welche an den nicht konservierten 
Aminosauresequenzpositionen von der Sequenz der Formeln I oder II abweichen, 
einschliesslich der an die codierenden Sequenzen, oder Teile davon, unter 
stringenten Bedingungen hybridisierenden Sequenzen, einschliesslich der 
Nucleotidsequenzen, welche die durch die Verbindungen der Formeln I oder II 
codierten Proteine, oder Teile davon, codieren, aber, als Resultat unterschiedlicher 
Verwendung alternativer Codons, degeneriert sind bezuglich der als Verbindungen 
der Formel I oder II definierten Nucleotidsequenzen, fur sogenannte Cell- 
Engineering-Anwendungen zur Produktion von gentechnologisch veranderten Zellen, 
welche die codierten Sequenzen, oder Teile davon, der Verbindungen der Formeln I 
oder II produzieren, zum Beispiel zum Zweck zelltherapeutischer Anwendung als 
Medikament nach Anspruch 2, 3, 4, 5, 6, 7, 8, 9, 10,11, 12, 13, 14, 15, 16, 17, 18, 19, 
20, oder 21. 

30. Verwendung der codierten Aminosauresequenzen der Verbindungen der 
Formeln I oder II, einschliesslich der separaten Teilsequenzen der codierten 
Aminosauresequenzen der Verbindungen der Formeln I oder II, wie beispielsweise 
die codierte Aminosauresequenz der katalytischen Domane oder einer oder mehrerer 
der andern Domanen oder Segmente, einschliesslich der codierten Sequenzen oder 
Teilsequenzen der den Verbindungen der Formeln I oder II entsprechenden Splice- 
Varianten, einschliesslich der codierten Sequenzen oder Teilsequenzen der den 
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Verbindungen der Formeln I oder II entsprechenden Allele, einschliesslich aller 
Sequenzvarianten der codierten Sequenzen, oder Teilen davon, der Verbindungen 
der Formeln I oder II, deren biologische Aktivitat derjenigen der codierten Sequenzen 
der Verbindungen der Formeln I oder II gleich oder ahnlich ist, beispielsweise 
5 Sequenzvarianten der Verbindungen der Formeln I oder II, welche an den nicht 
konservierten Aminosauresequenzpositionen von der Sequenz der Formeln I oder II 
abweichen, einschliesslich der Translationsprodukte, oder Teilen davon, der an die 
codierenden Sequenzen der Verbindungen der Formeln I oder II, oder an Teile 
davon, unter stringenten Bedingungen hybridisierenden Sequenzen, einschliesslich 
10 der codierten Sequenzen der Spezies-homologen Verbindungen der Verbindungen 
der Formeln I oder II, wie beispielsweise die codierten Sequenzen der Spezies- 
homologen Verbindungen der Ratte, des Kaninchens, des Rindes, des Schafes, des 
Schweins, der Primaten, der Vogel, des Zebrafisches, der Taufliege (Drosophila 
melanogaster), etc., einschliesslich der separaten Teilsequenzen der codierten 

15 Sequenzen der Spezies-homologen Verbindungen der Verbindungen der Formeln I 
oder II, wie beispielsweise die codierte Aminosauresequenz der katalytischen 
Domane, oder einer oder mehrerer der andern Domanen oder Segmente, als 
Antigene zur Herstellung von Antikorpern, wie beispielsweise Antikorper, welche die 
Protease-Funktion hemmen oder fordern, oder Antikorper, welche fur 

20 immunohistochemische Studien eingesetzt werden konnen. 

31. Verwendung der codierenden Nucleotidsequenzen der Verbindungen der 
Formeln I oder II, einschliesslich der separaten Teilsequenzen der codierenden 
Sequenzen dieser Verbindungen der Formeln I oder II, wie zum Beispiel die 

25 codierenden Sequenzen der katalytischen Domanen der Verbindungen der Formeln I 
oder II, einschliesslich der codierenden Sequenzen oder Teilsequenzen der den 
Verbindungen der Formeln I oder II entsprechenden Splice-Varianten, einschliesslich 
der codierenden Sequenzen, oder Teilsequenzen, der den Verbindungen der Formeln 
I oder II entsprechenden Allele, einschliesslich aller Sequenzvarianten der 

30 codierenden Sequenzen, oder von Teilen davon, der Verbindungen der Formeln I 
oder II. deren Translationsprodukte in ihrer biologischen Aktivitat denjenigen der 
Verbindungen der Formeln I oder II gleich oder ahnlich sind, beispielsweise 
Sequenzvarianten der Verbindungen der Formeln I oder II, welche an den nicht 
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konservierten Aminosauresequenzpositionen von der Sequenz der Formeln I Oder II 
abweichen, einschliesslich der an die codierenden Sequenzen, oder an Teile davon, 
unter stringenten Bedingungen hybridisierenden Sequenzen, einschliesslich der 
Nucleotidsequenzen, welche die durch die Verbindungen der Formeln I oder II 
codierten Proteine, oder Teile davon, codieren, aber, als Resultat unterschiedlicher 
Verwendung alternativer Codons, degeneriert sind beziiglich der als Verbindungen 
der Formel I oder II definierten Nucleotidsequenzen, fur die Herstellung von 
transgenen Tieren, wie beispielsweise transgene Mause. 

32. Verwendung der codierenden Nucleotidsequenzen der Verbindungen der 
Formeln I oder II, einschliesslich der separaten Teilsequenzen der codierenden 
Sequenzen dieser Verbindungen der Formeln I oder II, wie zum Beispiel die 
codierenden Sequenzen der katalytischen Domanen der Verbindungen der Formeln I 
oder II, einschliesslich der codierenden Sequenzen oder Teilsequenzen der den 
Verbindungen der Formeln I oder II entsprechenden Splice-Varianten, einschliesslich 
der codierenden Sequenzen, oder Teilsequenzen, der den Verbindungen der Formeln 
I oder II entsprechenden Allele, einschliesslich aller Sequenzvarianten der 
codierenden Sequenzen, oder von Teilen davon, der Verbindungen der Formeln I 
oder II, deren Translationsprodukte in ihrer bioiogischen Aktivitat denjenigen der 
Verbindungen der Formeln I oder II gleich oder ahnlich sind, beispielsweise 
Sequenzvarianten der Verbindungen der Formeln I oder II, welche an den nicht 
konservierten Aminosauresequenzpositionen von der Sequenz der Formeln I oder II 
abweichen, einschliesslich der an die codierenden Sequenzen, oder Teile davon, 
unter stringenten Bedingungen hybridisierenden Sequenzen, einschliesslich der 
Nucleotidsequenzen, welche die durch die Verbindungen der Formeln I oder II 
codierten Proteine, oder Teile davon, codieren, aber, als Resultat unterschiedlicher 
Verwendung alternativer Codons. degeneriert sind beziiglich der als Verbindungen 
der Formel I oder II definierten Nucleotidsequenzen, fur die Inaktivierung oder 
Abanderung des entsprechenden Gens mittels gezielten Eingriffen am Gen durch 
sogenannte "Gene Targeting"-Techniken, wie beispielsweise der Elimination des 
Gens bei der Maus durch homologe Rekombination. 

33. Verwendung der codierenden Nucleotidsequenzen der Verbindungen der 
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Formeln I oder II, einschliesslich der separaten Teilsequenzen der codierenden 
Sequenzen dieser Verbindungen der Formeln I oder II, wie zum Beispiel die 
codierenden Sequenzen der katalytischen Domanen der Verbindungen der Formeln I 
oder II t einschliesslich der codierenden Sequenzen oder Teilsequenzen der den 
Verbindungen der Formeln I oder II entsprechenden Splice-Varianten, einschliesslich 
der codierenden Sequenzen, oder Teilsequenzen, der den Verbindungen der Formeln 
I oder II entsprechenden Allele, einschliesslich aller Sequenzvarianten der 
codierenden Sequenzen, oder von Teilen davon, der Verbindungen der Formeln I 
oder II, deren Translationsprodukte in ihrer biologischen Aktivitat denjenigen der 
Verbindungen der Formeln I oder II gleich oder ahnlich sind, beispielsweise 
Sequenzvarianten der Verbindungen der Formeln I oder II, welche an den nicht 
konservierten Aminosauresequenzpositionen von der Sequenz der Formeln I oder II 
abweichen, einschliesslich der an die codierenden Sequenzen, oder Teile davon, 
unter stringenten Bedingungen hybridisierenden Sequenzen, einschliesslich der 
Nucleotidsequenzen, welche die durch die Verbindungen der Formeln I oder II 
codierten Proteine, oder Teile davon, codieren, aber, als Resultat unterschiedlicher 
Verwendung alternativer Codons, degeneriert sind bezuglich der als Verbindungen 
der Formeln I oder II definierten Nucleotidsequenzen, zur Diagnostik von Storungen 
im Gen, welches der Verbindung der Formel I zu Grunde liegt 

34. Verwendung der codierenden Nucleotidsequenzen der Verbindungen der 
Formeln I oder II, einschliesslich der separaten Teilsequenzen der codierenden 
Sequenzen dieser Verbindungen der Formeln I oder II, wie zum Beispiel die 
codierenden Sequenzen der katalytischen Domanen der Verbindungen der Formeln I 
oder II, einschliesslich der codierenden Sequenzen oder Teilsequenzen der den 
Verbindungen der Formeln I oder II entsprechenden Splice-Varianten, einschliesslich 
der codierenden Sequenzen oder Teilsequenzen der den Verbindungen der Formeln I 
oder II entsprechenden Allele, einschliesslich aller Sequenzvarianten der codierenden 
Sequenzen, oder von Teilen davon, der Verbindungen der Formeln I oder II, deren 
Translationsprodukte in ihrer biologischen Aktivitat denjenigen der Verbindungen der 
Formeln I oder II gleich oder ahnlich sind, beispielsweise Sequenzvarianten der 
Verbindungen der Formeln I oder II, welche an den nicht konservierten 
Aminosauresequenzpositionen von der Sequenz der Formeln I oder II abweichen, 
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einschliesslich der an die codierenden Sequenzen, Oder an Teile davon, unter 
stringenten Bedingungen hybridisierenden Sequenzen, einschliesslich der 
Nucleotidsequenzen, welche die durch die Verbindungen der Formein I oder II 
codierten Proteine, oder Teile davon, codieren, aber, als Resultat unterschiedlicher 
Verwendung alternativer Codons, degeneriert sind bezuglich der als Verbindungen 
der Formel I oder II definierten Nucleotidsequenzen, als Ausgangssequenz fur 
gentechnische Modifikationen zum Zweck der Erzeugung von Medikamenten oder 
Gentherapie-Vektoren, welche im Vergleich zu entsprechenden Medikamenten oder 
Gentherapie-Vektoren, welche die codierende Nucleotidsequenz der Verbindungen 
der Formel I oder II enthalten, veranderte Eigenschaften haben, wie beispielsweise 
veranderte proteolytische Aktivitat, veranderte proteolytische Spezifitat, oder 
veranderte pharmakokinetische Eigenschaften. 



Zusammenfassung 



Es werden Neurotrypsine der Formeln I oder II, einschliesslich die separaten 
codierenden und codierten Sequenzen dieser Verbindungen der Formeln I oder II 
beschrieben. 

Diese Verbindungen konnen als wenigstens eine aktive Verbindung in einem 
Medikament verwendet werden. 

Die codierten Peptidsequenzen dieser Verbindungen konnen als 
Zielsubstanzen (Targets) fur die Entwicklung von Pharmaca verwendet werden. 



